Совместное обучение агентов и векторных представлений графов в задаче управления конвейерными лентами
Аннотация:
Предмет исследования. Рассмотрена задача маршрутизации системы конвейерных лент на основе мультиагентного подхода. В большинстве данных конвейерных систем багажных лент в аэропортах используются алгоритмы маршрутизации, основанные на ручном моделировании поведения конвейеров. Такой подход плохо масштабируем. Новые исследования в области машинного обучения предлагают решать задачу маршрутизации с помощью обучения с подкреплением. Метод. Сформулирован подход к совместному обучению агентов и векторных представлений графа. В рамках подхода предложен алгоритм QSDNE, использующий агентов DQN и векторные представления SDNE. Основные результаты. Выполнен сравнительный анализ разработанного алгоритма c алгоритмами мультиагентной маршрутизации без совместного обучения. На основании результатов работы алгоритма QSDNE сделан вывод о его эффективности для оптимизации времени доставки и энергопотребления в конвейерных системах. Алгоритм позволил сократить среднее время доставки на 6 % по сравнению с лучшим аналогом. Практическая значимость. Разработанный подход может быть использован для решения задач маршрутизации со сложными функциями оценки пути и динамически меняющимися топологиями графов, а предложенный алгоритм — для управления конвейерными лентами в аэропортах и в цеховых производствах.
Ключевые слова:
Постоянный URL
Статьи в номере
- Импульсная запись динамических голограмм в кристалле силиката висмута при изменении длины волны лазерного излучения
- Гибридный эндоскоп с телевизионной и многоспектральной обработкой изображений для диагностики рака внутренних органов
- Моделирование композитного волноводного голографического дисплея
- Применение методов инфракрасной спектроскопии в исследовании составов для проклейки бумаги
- Методика оптимизации распределения плотности пикселов по зоне наблюдения
- Оценка ошибки и разработка методики компенсации погрешности позиционирования оборудования с числовым программным управлением
- Компенсация внешних возмущений по выходу для класса линейных систем с запаздыванием в канале управления
- Люминесцентный метод исследования роста квантовых точек AgInS2
- Особенности импульсного лазерного напыления тонких пленок InGaAsN в атмосфере активного фонового газа
- Нахождение распределения электронов в сверхрешетках AlGaAs/GaAs
- Спектральные и кинетические свойства квантовых точек сульфида серебра во внешнем электрическом поле
- Влияние наноразмерных горизонтальных неоднородностей на послойный анализ поверхности методом рентгеновской фотоэлектронной спектроскопии
- Органические светоизлучающие диоды с новыми красителями на основе кумарина
- Изготовление и характеристика гибридного композита Al6082/SiC/порошок рисовой шелухи, получаемого методом фрикционного перемешивания
- Многопутевая безопасная маршрутизация для обнаружения атаки с захватом узла в беспроводной сенсорной сети
- Метод документирования архитектурных решений вычислительных платформ
- Повышение точности распознавания внесловарных слов для интегральной системы автоматического распознавания русской речи
- Метод мониторинга состояния элементов киберфизических систем на основе анализа временных рядов
- Применение волновой модели текста к задаче сентимент-анализа
- Автоматизированная оценка параметров электрокардиограмм в условиях пандемии COVID-19
- Мультиагентная адаптивная маршрутизация агентами-клонами на основе многоголового внутреннего внимания с использованием обучения с подкреплением
- Моделирование процессов переноса излучения в газожидкостных пенах
- Статистическая оценка влияния величины сигнал/помеха на погрешность измерения параметров акустической эмиссии
- Моделирование процесса стационарного термоотражения для измерения теплопроводности материалов
- Математическое и компьютерное моделирование однорядных и двухрядных шестилопастных винтокольцевых движителей
- Дифференциально-разностная модель теплопереноса в твердых телах с использованием метода параметрической идентификации